查看原文
其他

Hemberg-lab单细胞转录组数据分析(十二)- Scater单细胞表达谱tSNE可视化

陈同 生信宝典 2022-03-28

单细胞系列教程

tSNE聚类

scRNA-seq中另一个常用的可视化方法是tSNE。tSNE (t-Distributed Stochastic Neighbor Embedding) 通过组合降维(如PCA)和最近邻网络随机行走算法在保留细胞的局部距离的基础上实现高维数据(14000维基因表达)到二维空间的映射。与PCA不同,tSNE算法有随机性,每次运行结果都会不同。因为它的非线性和随机性特征,tSNE结果难以直观解释。为了保证重复性,我们固定一个随机数种子使得每次结果都一致。

PCA线性降维算法在集中将不相似的数据点放置在较低维度区域时,尽可能多的保留原始数据的差异,因此导致小部分数据点相距甚远,大部分数据重叠放置。tSNE把点的高维空间的距离转换成点的相似度的概率,维持高维空间和低维空间中一对点之间的条件概率差值总和最小。同时使用t-分布的长尾性解决高维数据映射到低维时的重叠问题。t-SNE算法定义了数据的局部和全局结构之间的软边界,既可以使点在局部分散,又在全局聚集,同时照顾近距离和远距离的点。其性能优于任何非线性降维算法。具体见推文还在用PCA降维?快学学大牛最爱的t-SNE算法吧(附Python/R代码)和B站视频https://www.bilibili.com/video/av19592239?from=search&seid=1152699498338102899。

QC前TSNE

set.seed(123456)
umi_endog <- runTSNE(umi_endog, exprs_values = "logcounts_raw", perplexity = 130)
scater::plotTSNE(
umi_endog,
by_exprs_values = "logcounts_raw",
colour_by = "batch",
size_by = "total_features_by_counts",
shape_by = "individual"
)

# plotTSNE(
# umi[endog_genes, ],
# exprs_values = "logcounts_raw",
# perplexity = 130,
# colour_by = "batch",
# size_by = "total_features",
# shape_by = "individual",
# rand_seed = 123456
# )

QC后TSNE

set.seed(123456)
umi.qc_endog <- runTSNE(umi.qc_endog, exprs_values = "logcounts_raw", perplexity = 130)
scater::plotTSNE(
umi.qc_endog,
by_exprs_values = "logcounts_raw",
colour_by = "batch",
size_by = "total_features_by_counts",
shape_by = "individual"
)

# plotTSNE(
# umi.qc[endog_genes, ],
# exprs_values = "logcounts_raw",
# perplexity = 130,
# colour_by = "batch",
# size_by = "total_features",
# shape_by = "individual",
# rand_seed = 123456
# )

比较两张图可以发现质控过滤后NA19098.r2来源的细胞不再是异常值。

tSNE要求提供一个perplexity参数用于指定构建最近邻网络的邻居数,这个值越高网络越致密细胞越成团围抱;这个值越小网络会越稀疏使得细胞不同的相似度分组相对分散。scater默认的perplexity值是细胞总数除以5(不能整除的部分舍去)。

tSNE的缺点见http://distill.pub/2016/misread-tsne/)。

练习 2:选择不同的perplexity值如10或200看下对结果的影响。

答案

(Perplexity=10)(Perplexity=200) 


易生信系列培训课程,扫码获取免费资料

更多阅读

画图三字经 生信视频 生信系列教程 

心得体会 TCGA数据库 Linux Python 

高通量分析 免费在线画图 测序历史 超级增强子

生信学习视频 PPT EXCEL 文章写作 ggplot2

海哥组学 可视化套路 基因组浏览器

色彩搭配 图形排版 互作网络

自学生信

后台回复“生信宝典福利第一波”获取教程合集

听说分享到朋友圈的朋友会在公众号周年庆时中奖 (大家还记得去年的大放送吧,不记得查查历史)

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存